@丛进:计量与认知:汉语词汇形式结构的实证研究范式
计量与认知:汉语词汇形式结构的实证研究范式
1. 引言:从定性到实证
-
传统研究方法: 侧重语感的定性分析。
- 优点: 简便易行。
- 局限:
- 描述不精确: 只能回答“是什么”(范畴),难以回答“有多少、多能产”(量化)的问题。
- 缺乏实证检验: 基于研究者直觉的论断,需要客观数据验证。
-
发展方向: 实证研究,基于客观数据进行检验和描述。
-
两大实证范式:
- 计量研究范式 (The Quantitative Paradigm)
- 数据源: 词典、真实语料库 (Corpus)。
- 目标: 揭示词汇形式结构的计量特征和统计规律。
- 关注点: 语言使用的结果。
- 认知研究范式 (The Cognitive Paradigm)
- 数据源: 心理-神经实验 (反应时、眼动、ERP等)。
- 目标: 考察形式结构在认知加工(存储、提取、习得)中的作用,探寻其心理-神经现实性。
- 关注点: 语言使用的过程。
- 计量研究范式 (The Quantitative Paradigm)
-
共同关注的现象:
- 成词元素: 语素的自由-黏着之分。
- 内部结构: 语法结构、词长、语素配列等。
- 产能: 成词元素和模式的能产性。
2. 计量研究范式:揭示统计规律
2.1 成词元素类型的计量研究 (语素)
- 核心: 语素的自由-黏着属性。
- 方法: 基于词典或语素数据库进行统计。
- 发现:
- 汉语语素总体上比较自由,约42.7%的语素能独立成词 (苑春法, 1998)。
- 相当数量的语素具有定位性(倾向于出现在词首或词尾)。
- 未来方向:
- 使用真实语料: 词典数据不能完全反映真实使用规律。
- 量化“自由度”: 将“自由/黏着”的二分法,转变为基于概率的连续性概念。
2.2 词汇内部结构特征的计量研究
2.2.1 内部结构模式
- 研究对象:
- 语法结构: 偏正式、并列式、述宾式等。
- 语素词类配列: 名+名、动+名等。
- 切分单位长度配列: 如三音节词的 1+2 vs. 2+1 模式。
- 主要发现:
- 语法结构: 偏正式是现代汉语词汇中最具优势的结构 (陈昌勇、端木三, 2016)。
- 词类配列: 双音节词中,名+名、动+名、动+动式最具优势。
- 长度配列: 三音节词优势模式为 2+1 式,四音节词为 2+2 式。
2.2.2 词长
-
常规统计发现:
- 优势地位: 双音节词在现代汉语中占绝对优势。
- 弹性词长: 约50%的汉语单纯词具有弹性词长(如“学”和“学习”),比例高于英语 (Duanmu & Dong, 2016)。
- 普遍规律: 词频越高,词长越短;多义度越高。
-
计量语言学发现 (Linguistic Laws):
- 采用数学方程(如幂律方程
)精确描述词长(x)与词频(y)的反比关系,揭示了语言的普适性规律 (邓耀臣, 2013)。 - 这类研究为“汉语中是否存在‘词’”这一根本问题提供了新的实证参考。
- 采用数学方程(如幂律方程
2.3 产能的计量研究
- 核心: 定量回答“有多能产”。
- 方法:
- 基于计数: 直接统计某语素或模式构成的词汇总数。
- 基于概率分布: 采用真实语料,考察其成词的概率模型。
- 发现:
- 单音节语素的成词数分布近似右偏态泊松分布,以构成2个词者居多 (尹斌庸, 1984)。
- 从产能来看,词根复合与词词复合之间并无必要划清界限。
3. 认知研究范式:探寻心理现实
3.1 成词元素类型的认知研究
- 核心: 自由-黏着、定位性等特征是否具有心理现实性。
- 方法: 词汇判断、眼动追踪等实验。
- 发现:
- 自由-黏着差异: 对词首为自由语素的词(如“火车”)的判断显著快于词首为黏着语素的词(如“老虎”),证明大脑对该差异敏感 (冯丽萍, 2004)。
- 定位性影响: 当一个偏好在词首的语素出现在词尾时,读者的凝视时间会更长,证明大脑利用了语素的位置概率信息 (Yen et al., 2012)。
3.2 内部结构特征的认知研究
- 语法结构与配列:
- 不同语法结构类型在加工时会引发不同的大脑电位(ERP)反应(如 P2a 波幅),证明大脑在词汇识别早期就启动了结构分析 (顾介鑫等, 2012)。
- 长度配列:
- 四字成语的 2+2 韵律模式能显著促进其听觉和视觉加工,即使其内部语法结构并非2+2 (张辉等, 2013)。
- 词长:
- 词长效应 (Word Length Effect) 在汉语中普遍存在:长词比短词的命名、回忆、阅读加工时间更长。
3.3 产能的认知研究
- 方法: ERP 实验。
- 发现:
- 高产能的偏正式结构比低产能的并列式结构引发了更大的 P600 脑电波,这表明大脑对构词模式的产能(即统计规律)具有神经敏感性,支持了产能的神经现实性 (顾介鑫、杨亦鸣, 2010)。
- 词首语素的产能高低会影响复合词的加工速度。
4. 两大范式的互补与协作
-
关系: 视角与数据源互为补充,研究方法上存在协作趋势。
-
互补性 (Complementarity):
- 计量范式: 关注语言使用结果(静态分布),如统计发现四音节词中2+2结构占优。
- 认知范式: 关注语言使用过程(动态加工),如实验证明2+2的韵律促进加工。
- 二者共同构成了对语言现象的完整认识图景。
-
协作性 (Collaboration): “计量先行,认知跟进”
- 模式:
- 计量研究基于语料库数据发现统计规律,并提出假设。
- 认知研究设计实验来检验这些规律的心理现实性。
- 案例:
- 词长组合偏好: Duanmu (2012) 通过语料库统计发现,名+名结构中,汉语使用者倾向于避免 1+2 式组合(如“煤商店”)。Qin & Duanmu (2017) 通过可接受度判断实验证实了这一偏好。然而实验也发现,1+1 式(如“煤店”)虽然在语料库中数量最多,但其可接受度却最低,这揭示了语言使用频率与心理认知规律之间可能存在不一致,凸显了协作的必要性。
- 模式:
5. 总体评价与展望
- 贡献: 两大范式将汉语词汇形式结构研究从直觉思辨推向了科学实证,形成了“定性研究为先导,实证研究为后继”的完整研究链条。
- 价值:
- 回馈传统: 检验和修正了传统定性研究的结论。
- 开拓空间: 发现了新的语言现象和规律。
- 应用前景: 研究成果可为语言教学、词表编制、教材编写等实践领域提供科学依据。
- 未来方向:
- 深化拓展: 在各自领域内进行更深入的研究。
- 加强协作: 推动“计量先行,认知跟进”模式,探索更多语言使用与语言认知之间的关联。